智能论文笔记

Quantization Adaptor for Bit-Level Deep Learning-Based Massive MIMO CSI Feedback

Xudong Zhang , Zhilin Lu , Rui Zeng , Jintao Wang

分类：人工智能

2022-11-05

In massive multiple-input multiple-output (MIMO) systems, the user equipment (UE) needs to feed the channel state information (CSI) back to the base station (BS) for the following beamforming. But the large scale of antennas in massive MIMO systems causes huge feedback overhead. Deep learning (DL) based methods can compress the CSI at the UE and recover it at the BS, which reduces the feedback cost significantly. But the compressed CSI must be quantized into bit streams for transmission. In this paper, we propose an adaptor-assisted quantization strategy for bit-level DL-based CSI feedback. First, we design a network-aided adaptor and an advanced training scheme to adaptively improve the quantization and reconstruction accuracy. Moreover, for easy practical employment, we introduce the expert knowledge of data distribution and propose a pluggable and cost-free adaptor scheme. Experiments show that compared with the state-of-the-art feedback quantization method, this adaptor-aided quantization strategy can achieve better quantization accuracy and reconstruction performance with less or no additional cost. The open-source codes are available at https://github.com/zhangxd18/QCRNet.

translated by 谷歌翻译

Boosting the Discriminant Power of Naive Bayes

Shihe Wang , Jianfeng Ren , Xiaoyu Lian , Ruibin Bai , Xudong Jiang

分类：机器学习

2022-09-20

幼稚的贝叶斯在许多应用中广泛使用，因为它具有简单性和处理数值数据和分类数据的能力。但是，缺乏特征之间的相关性建模会限制其性能。此外，现实世界数据集中的噪声和离群值也大大降低了分类性能。在本文中，我们提出了一种功能增强方法，该方法采用堆栈自动编码器来减少数据中的噪声并增强幼稚贝叶斯的判别能力。提出的堆栈自动编码器由两个用于不同目的的自动编码器组成。第一个编码器缩小了初始特征，以得出紧凑的特征表示，以消除噪声和冗余信息。第二个编码器通过将功能扩展到更高维度的空间中来增强特征的判别能力，从而使不同类别的样品在较高维度的空间中可以更好地分离。通过将提出的功能增强方法与正规化的幼稚贝叶斯集成，该模型的歧视能力得到了极大的增强。在一组机器学习基准数据集上评估所提出的方法。实验结果表明，所提出的方法显着且始终如一地优于最先进的天真贝叶斯分类器。

translated by 谷歌翻译

A Max-relevance-min-divergence Criterion for Data Discretization with Applications on Naive Bayes

Shihe Wang , Jianfeng Ren , Ruibin Bai , Yuan Yao , Xudong Jiang

分类：机器学习

2022-09-20

在许多分类模型中，数据被离散化以更好地估计其分布。现有的离散方法通常是针对最大化离散数据的判别能力的，同时忽略了分类中数据离散化的主要目标是改善概括性能。结果，数据往往会超出许多小型垃圾箱，因为数据没有离散化保留了最大判别信息。因此，我们提出了一个最大依赖性最差（MDMD）标准，该标准可最大程度地提高离散数据的判别信息和概括能力。更具体地说，最大依赖性标准可最大化离散数据和分类变量之间的统计依赖性，而最小差异标准则明确最大程度地减少了给定离散方案的训练数据与验证数据之间的JS差异。拟议的MDMD标准在技术上很有吸引力，但是很难可靠地估计属性的高阶联合分布和分类变量。因此，我们进一步提出了一个更实用的解决方案，最大值 - 差异 - 差异（MRMD）离散方案，其中每个属性通过同时最大化判别信息和离散数据的概括能力分别离散化。将提出的MRMD与45个机器学习基准数据集的Naive Bayes分类框架下的最新离散算法进行了比较。它大大优于大多数数据集上所有比较的方法。

translated by 谷歌翻译

Sample-Efficient Multi-Agent Reinforcement Learning with Demonstrations for Flocking Control

Yunbo Qiu , Yuzhu Zhan , Yue Jin , Jian Wang , Xudong Zhang

分类：机器学习 | 人工智能 | 机器人

2022-09-17

在多机构系统（例如多机构无人驾驶汽车和多机构自动驾驶水下车辆）中，羊群控制是一个重大问题，可增强代理的合作和安全性。与传统方法相反，多机构增强学习（MARL）更灵活地解决了羊群控制的问题。但是，基于MARL的方法遭受了样本效率低下的影响，因为它们需要从代理与环境之间的相互作用中收集大量的经验。我们提出了一种新颖的方法，该方法对MARL（PWD-MARL）的示范进行了预处理，该方法可以利用以传统方法预处理剂来利用非专家示范。在预审进过程中，代理人同时通过MARL和行为克隆从示范中学习政策，并阻止过度拟合示范。通过对非专家示范进行预处理，PWD-MARL在温暖的开始中提高了在线MAL的样品效率。实验表明，即使发生不良或很少的示威，PWD-MARL在羊群控制问题中提高了样本效率和政策性能。

translated by 谷歌翻译

Sub-optimal Policy Aided Multi-Agent Reinforcement Learning for Flocking Control

Yunbo Qiu , Yue Jin , Jian Wang , Xudong Zhang

分类：机器学习 | 人工智能 | 机器人

2022-09-17

羊群控制是一个具有挑战性的问题，在维持羊群的同时，需要达到目标位置，并避免了环境中特工之间的障碍和碰撞碰撞。多代理增强学习在羊群控制中取得了有希望的表现。但是，基于传统强化学习的方法需要代理与环境之间的相互作用。本文提出了一项次优政策帮助多代理增强学习算法（SPA-MARL），以提高样本效率。 Spa-Marl直接利用可以通过非学习方法手动设计或解决的先前政策来帮助代理人学习，在这种情况下，该策略的表现可以是最佳的。 SPA-MARL认识到次优政策与本身之间的性能差异，然后模仿次优政策，如果次优政策更好。我们利用Spa-Marl解决羊群控制问题。基于人造潜在领域的传统控制方法用于生成次优政策。实验表明，水疗中心可以加快训练过程，并优于MARL基线和所使用的次优政策。

translated by 谷歌翻译

SCULPTOR: Skeleton-Consistent Face Creation Using a Learned Parametric Generator

Zesong Qiu , Yuwei Li , Dongming He , Qixuan Zhang , Longwen Zhang , Yinghao Zhang , Jingya Wang , Lan Xu , Xudong Wang , Yuyao Zhang

分类：计算机视觉

2022-09-14

近年来，由于其在数字人物，角色产生和动画中的广泛应用，人们对3D人脸建模的兴趣越来越大。现有方法压倒性地强调了对面部的外部形状，质地和皮肤特性建模，而忽略了内部骨骼结构和外观之间的固有相关性。在本文中，我们使用学习的参数面部发电机提出了雕塑家，具有骨骼一致性的3D面部创作，旨在通过混合参数形态表示轻松地创建解剖上正确和视觉上令人信服的面部模型。雕塑家的核心是露西（Lucy），这是与整形外科医生合作的第一个大型形状面部脸部数据集。我们的Lucy数据集以最古老的人类祖先之一的化石命名，其中包含正牙手术前后全人头的高质量计算机断层扫描（CT）扫描，这对于评估手术结果至关重要。露西（Lucy）由144次扫描，分别对72名受试者（31名男性和41名女性）组成，其中每个受试者进行了两次CT扫描，并在恐惧后手术中进行了两次CT扫描。根据我们的Lucy数据集，我们学习了一个新颖的骨骼一致的参数面部发电机雕塑家，它可以创建独特而细微的面部特征，以帮助定义角色，同时保持生理声音。我们的雕塑家通过将3D脸的描绘成形状混合形状，姿势混合形状和面部表达混合形状，共同在统一数据驱动的框架下共同建模头骨，面部几何形状和面部外观。与现有方法相比，雕塑家在面部生成任务中保留了解剖学正确性和视觉现实主义。最后，我们展示了雕塑家在以前看不见的各种花式应用中的鲁棒性和有效性。

translated by 谷歌翻译

Voxurf: Voxel-based Efficient and Accurate Neural Surface Reconstruction

Tong Wu , Jiaqi Wang , Xingang Pan , Xudong Xu , Ziwei Liu , Dahua Lin

分类：计算机视觉

2022-08-26

神经表面重建旨在基于多视图图像重建准确的3D表面。基于神经量的先前方法主要训练完全隐式的模型，它们需要单个场景的数小时培训。最近的努力探讨了明确的体积表示，该表示通过记住可学习的素网格中的重要信息，从而大大加快了优化过程。但是，这些基于体素的方法通常在重建细粒几何形状方面遇到困难。通过实证研究，我们发现高质量的表面重建取决于两个关键因素：构建相干形状的能力和颜色几何依赖性的精确建模。特别是，后者是准确重建细节的关键。受这些发现的启发，我们开发了Voxurf，这是一种基于体素的方法，用于有效，准确的神经表面重建，该方法由两个阶段组成：1）利用可学习的特征网格来构建颜色场并获得连贯的粗糙形状，并且2）使用双色网络来完善详细的几何形状，可捕获精确的颜色几何依赖性。我们进一步引入了层次几何特征，以启用跨体素的信息共享。我们的实验表明，Voxurf同时达到了高效率和高质量。在DTU基准测试中，与最先进的方法相比，Voxurf获得了更高的重建质量，训练的加速度为20倍。

translated by 谷歌翻译

HTML版本

NeIF: Representing General Reflectance as Neural Intrinsics Fields for Uncalibrated Photometric Stereo

Zongrui Li , Qian Zheng , Feishi Wang , Boxin Shi , Gang Pan , Xudong Jiang

分类：计算机视觉

2022-08-18

未校准的光度立体声（UPS）由于未知光带来的固有歧义而具有挑战性。现有的解决方案通过将反射率明确关联到光条件或以监督方式解决光条件来减轻歧义。本文建立了光线线索和光估计之间的隐含关系，并以无监督的方式解决了UPS。关键思想是将反射率表示为四个神经内在字段，即\ ie，位置，光，镜头和阴影，基于神经光场与镜面反射和铸造阴影的光线线索隐含相关联。神经内在字段的无监督，关节优化可以不受训练数据偏差和累积误差，并完全利用所有观察到的像素值的UPS值。我们的方法在常规和具有挑战性的设置下，在公共和自我收集的数据集上获得了优于最先进的UPS方法的优势。该代码将很快发布。

translated by 谷歌翻译

Toward Understanding WordArt: Corner-Guided Transformer for Scene Text Recognition

Xudong Xie , Ling Fu , Zhifei Zhang , Zhaowen Wang , Xiang Bai

分类：计算机视觉

2022-07-31

艺术文本识别是一项极具挑战性的任务，具有广泛的应用程序。但是，当前场景文本识别方法主要集中于不规则文本，而未专门探讨艺术文本。艺术文本识别的挑战包括具有特殊设计的字体和效果的各种外观，字符之间的复杂连接和重叠以及背景模式的严重干扰。为了减轻这些问题，我们建议在三个层面上识别艺术文本。首先，考虑到角结构对外观和形状的稳健性，使用角点指导角色内部特征的提取。通过这种方式，角点的离散性切断了字符之间的连接，它们的稀疏性改善了背景干扰的稳健性。其次，我们设计了一个字符对比损失，以模拟字符级别的特征，从而改善了字符分类的特征表示。第三，我们利用变形金刚在图像级别上学习全局功能，并在角落跨注意机制的帮助下对角点的全球关系进行建模。此外，我们提供了一个艺术文本数据集来基准表演。实验结果验证了我们提出的方法在艺术文本识别方面的显着优势，并在几个模糊和透视数据集上实现了最先进的性能。

translated by 谷歌翻译

Deep Contrastive One-Class Time Series Anomaly Detection

Rui Wang , Chongwei Liu , Xudong Mou , Xiaohui Guo , Kai Gao , Pin Liu , Tianyu Wo , Xudong Liu

分类：机器学习 | 人工智能

2022-07-04

时间序列数据的积累和标签的不存在使时间序列异常检测（AD）是自我监督的深度学习任务。基于单拟合的方法只能触及整个正态性的某些方面，不足以检测各种异常。其中，AD采用的对比度学习方法总是选择正常的负面对，这是反对AD任务的目的。现有的基于多促进的方法通常是两阶段的，首先应用了训练过程，其目标可能与AD不同，因此性能受到预训练的表示的限制。本文提出了一种深层对比的单级异常检测方法（COCA），该方法结合了对比度学习和一级分类的正态性假设。关键思想是将表示和重建表示形式视为无阴性对比度学习的积极对，我们将其命名为序列对比。然后，我们应用了由不变性和方差项组成的对比度损失函数，前者同时优化了这两个假设的损失，后者则防止了超晶体崩溃。在四个现实世界中的时间序列数据集上进行的广泛实验表明，所提出的方法的卓越性能达到了最新。该代码可在https://github.com/ruiking04/coca上公开获得。

translated by 谷歌翻译